## Parsed with column specification:
## cols(
## series_name = col_character(),
## episode = col_character(),
## series_ep = col_integer(),
## season = col_integer(),
## season_ep = col_integer(),
## url = col_character(),
## user_rating = col_double(),
## user_votes = col_double(),
## r1 = col_double(),
## r2 = col_double(),
## r3 = col_double(),
## r4 = col_double(),
## r5 = col_double(),
## r6 = col_double(),
## r7 = col_double(),
## r8 = col_double(),
## r9 = col_double(),
## r10 = col_double()
## )
Antes de responder a esta pergunta podemos tentar ter um panorama geral do comportamento das notas atribuídas a cada temporada de uma série. Nos gráficos abaixo podemos ver, por exemplo, que os produtores de American Idol foram bastante persistentes uma vez que desde a primeira teporada o show não foi bem recebido pelo público. Depois de muitos altos e baixos, na 12ª temporada quando a nota foi a segunda pior da sua história, as temporadas seguintes vêm mostrando um crescimento bastante alto atingindo a nota máxima, 6.72 na 15ª temporada.
Porém também podemos observar casos em que aparentemente os produtores não souberam quando parar. Os Simpsons ilustram bem essa situação. A série passa bastante tempo bem sucedida mas a partir mais ou menos da 11ª temporada, sua nota começa a cair bastante chegando a 6.67 na 28ª temporada.
Ainda analisando os gráficos, outro fato interessante é que quando começam, as séries ficam num limbo entre 6.8 e 9.2 e aparentemente há um processo de funilamento até a 8ª temporada. Outra coisa que chama atenção é um conjunto de séries que aparecem com um traço sempre crescente até mais ou menos a 4ª temporada.
series_by_season = series %>%
group_by(series_name, season) %>%
summarise(mean_user_rating = mean(user_rating))
series_by_season %>%
ggplot(aes(x = season, y = mean_user_rating, group = series_name)) +
geom_line(size = 0.1, alpha = 0.5)
means_by_season = plot_ly(series_by_season,
x = ~season,
y = ~mean_user_rating,
color = ~series_name,
type = "scatter",
mode = "lines") %>%
layout(showlegend = FALSE)
means_by_season
## Warning in RColorBrewer::brewer.pal(N, "Set2"): n too large, allowed maximum for palette Set2 is 8
## Returning the palette you asked for with that many colors
#usually, how many seasons has successful serie?